# # ChatDoc:又一个智能文档助手
#
# - 读取pdf、excel、doc三种常见的文档格式
# - 根据文档内容，智能抽取内容并输出相应格式

#安装必须的包
# pip install docx2txt
# pip install pypdf
# pip install nltk

#导入必须的包
from langchain_community.document_loaders import UnstructuredExcelLoader

#定义chatdoc
class ChatDoc():

    @staticmethod
    def getFile():
        try:
            #读取文件
            loader = UnstructuredExcelLoader("example/fake.xlsx",mode="elements")
            text = loader.load()
            return text;
        except Exception as e:
            print(f"Error loading files:{e}")
res = ChatDoc.getFile()
print(res)